Статический и динамический анализ php-кода

15 августа 2011 г. · 4 мин. чтения

Автоматический анализ кода (static code analysis) очень полезен на больших проектах и он часто встраивается в серверы непрерывной интеграции. Некоторые IDE уже поставляются с простыми аналитическими инструментами, но первые всё-таки предпочтительней, потому что туда смотрит вся комманда. Всё что этот софт делает это периодически смотрит в систему версионирования (SVN) и строит график качества (и например запускает юнит-тесты). По сути это аналог комплекса упражнений для человека, поддерживающих хорошее здоровье и бъющих тревогу если возникает рак спагетти-кода.

Самые известные CI-серверы:

Hudson и его бесплатный двойник Jenkins (на java, много модулей) → есть шаблон
CruiseControl
Atlassian Bamboo
Jetbrains TeamCity
BuildBot
Xinc
Arbit (включает в себя project management и bugtracker)

Статический анализ кода и его метрики

В целом, статический анализ кода сводится к оценке метрик кода с поиском потенциальных проблем. Начиная с банальных необъявленных или не использующихся переменных и заканчивая поиском дубликатов. Метрики позволяют оценить цену и сложность проекта для планирования дальнейших работ, позволяют оценить влияние от новых методологий и инструментов, уменьшают время поиска проблемных мест как по пакетам так и по разработчикам.

Метрик очень много и каждый аналитический инструмент по разному их формулирует и сокращает, поэтому единой картинки добиться сложно, хотя и есть закономерность в шагании по стопам java

Размерные метрики

NOP - число пакетов
NOC - число классов → Число классов в пакете (Java =17, C++=19)
NOM - число методов → Число методов в классе (Java = 7, C++ = 9)
LOC - число строк → Ошибок/KLOC, Документации/KLOC
IOp - число параметров входа/выхода
IOg - число переменных вызываемых методом (классовых и глобальных, не локальных)
IOvar = IOp + IOg
CS - число атрибутов и методов. Может указывать на слишком большую ответственность одного класса
NOO - число переписанных родительских методов в дочерних классах. Указывает на высокую или низкую абстракцию
NOA - число новых методов в зависимости от глубины наследования

Метрики наследования

ANDC - среднее число наследующих классов (Java = 0.41, C++ = 0.28)
AHH - средняя высота иерархии (Java = 0.21, C++ = 0.13)
MIF = число унаследованных но не перезаписанных методов / общее число методов, указывает на степень абстракции или специализации класса (значение от 0 до 1)
PF - фактор наследования = число наследуемых методов / (число новых методов * число дочерних классов ), показывает насколько используются наследуемые методы (значение от 0 до 1)

Метрики сложности

CF - фактор связанности двух классов (т.е. один класс вызывает или использует методы/свойства другого класса) = число вызовов / максимальное число вызовов (значение от 0 до 1)
CALLS - число вызовов методов
FANOUT- число (вызываемых ) классов → (fin+fout)2 * len
Структурная сложность = CALLS 2
Сложность данных SC = IOvar / (CALLS +1)
Цикломатическая сложность CC = число решений / число строк (Java = 0.2, C++ = 0.25). Разные научные определения (Halstead, McCabe, McClure)
Системная сложность: SYSC = SC + SD

Некоторые программы ещё измеряют степень безопасности через число точек прямого входа, т.е. использования параметров GET, POST, SESSION, FILE.

Инструменты

Для php таких аналитических программ относительно мало — есть консольные узкоспециализированные программки:

Depend - использует некоторые приведённые выше метрики для анализа сложности pdepend --overview-pyramid=out.svg my_project_namepdepend --jdepend-chart=out2.svg my_project_name pdepend --jdepend-xml=out.xml my_project_namedependencies.php out.xml -o out3.svg
Mess detector - ищет неиспользуемый код и сложные выражения phpmd my_project_name text phpmd.xml
Code sniffer - проверяет названия методов и переменных согласно правилам из XML-файла настроек phpcs --standard=CodeREview --report-source my_project_name
Dead code detector ищет невызываемый код
Copy-paste detector
phploc - оценивает размер
phploc my_project_name
PHPLint - проверяет синтаксис и генерирует документацию
Analzer for Type Mismatches - ищет возможные ошибки с несовместимостью типов

Ещё есть чуть более общие PMD (на java) и phpsat, специализированные RIPS, RATS (как вариант Fortify360 + Jenkins), Yasca, Pixy и агрегаторы всего что только можно - PHPUnit, PHPLint, Sonar

Динамический анализ кода

В отличие от статического анализа, здесь система должна работать. Причём нас на этом этапе заботят - скорость работы всей системы (и узкие места) и логическая безошибочность. Соответсвенно решается это

Покрытие кода тестами (Statement, Branch, Path coverage)
Граф скорости загрузки и использования памяти в зависимости от методов

Инструменты

Selenium
XDebug
Zend Server
KCachegrind, Webgrind, cachegrindvisualizer

Статический анализ кода и его метрики​

Размерные метрики​

Метрики наследования​

Метрики сложности​

Инструменты​

Динамический анализ кода​

Статический анализ кода и его метрики

Размерные метрики

Метрики наследования

Метрики сложности

Инструменты

Динамический анализ кода